Condensés de textes par des méthodes numériques
نویسندگان
چکیده
Since information in electronic form is already a standard, and that the variety and the quantity of information become increasingly large, the methods of summarizing or automatic condensation of texts is a critical phase of the analysis of texts. This article describes Cortex a system based on numerical methods, which allows obtaining a condensation of a text, which is independent of the topic and of the length of the text. The structure of the system enables it to find the abstracts in French or Spanish in very short times. Résumé Étant donné que la variété et la quantité de l’information sous forme électronique deviennent de plus en plus grandes, des méthodes d’obtention de résumés ou de condensation automatique de textes constituent une phase critique de l’analyse de textes. Cet article décrit Cortex, un système basé sur des méthodes numériques qui permet l’obtention d’un condensé d’un texte, qui est indépendant du thème, de l’ampleur du texte et de la façon dont il est écrit. La structure du système lui permet de trouver la condensation de textes multilangues dans des temps très courts. Des applications en français ou espagnol sont présentées et analysées.
منابع مشابه
Un outil de détection automatique de thèmes
Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...
متن کاملTLabel: Nouvel opérateur d'agrégation par catégorisation dans les cubes de textes
Résumé. L’analyse en ligne (OLAP) dans les cubes de textes nécessite la définition de nouveaux types d’opérateurs d’analyse appropriés aux données textuelles. En effet, les opérateurs d’agrégation classiques ont montré leur efficacité pour l’analyse en ligne des données numériques, mais ils sont inadaptés pour l’analyse des données textuelles. Dans cet article, nous proposons un nouvel opérateu...
متن کاملReprésentation Symbolique de Trajectoires Géolocalisées
RESUME. Énormément de trajectoires géolocalisées sont produites et disponibles, mais leur exploitation pour en tirer des informations intéressantes reste difficile. L'obstacle qui nous intéresse ici est la mauvaise qualité de certaines de ces données : échantillonnage très irrégulier et précision médiocre. Nous proposons de les transposer dans des domaines symboliques pour pouvoir effectuer des...
متن کاملAnalyse statique de programmes et systèmes numériques
Alors que la complexité des traitements informatiques dans les systèmes embarqués croit chaque jour, la sûreté du fonctionnement de ces systèmes devient un enjeu crucial, tout particulièrement pour les systèmes critiques. Plus largement, synthétiser et garantir des propriétés sur le comportement d’un programme, est un objectif naturel et de large utilité. Cette habilitation (Putot, 2012) porte ...
متن کاملFast non-iterative methods for defect identification
This communication summarizes recent investigations on the identification of defects (cavities, inclusions) of unknown geometry and topology by means of the concept of topological sensitivity. This approach leads to the fast computation (equivalent to performing a few direct solutions), by means of ordinary numerical solution methods such as the BEM (used here), the FEM or the FDM, of defect in...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- CoRR
دوره abs/1212.1918 شماره
صفحات -
تاریخ انتشار 2001